संक्षिप्त विवरण
CNN एल्गोरिथ्म को Grayscale प्रारूप में चेहरे की छवियों जैसे दृश्य डेटा का विश्लेषण करने के लिए लागू किया जाता है, जिसे तब बुनियादी अभिव्यक्तियों की सात श्रेणियों में वर्गीकृत किया जाता है: खुश, उदास, क्रोधित, हैरान, भय, घृणा और तटस्थ। इस मॉडल को डेटासेट FER2013 का उपयोग करके प्रशिक्षित किया जाता है और 500 epoch के लिए प्रशिक्षण के बाद सफलतापूर्वक 91.67% की सटीकता तक पहुंच गया।
परियोजना लक्ष्य
कृत्रिम बुद्धिमत्ता के आधार पर चेहरे की अभिव्यक्ति शुरू करने की एक प्रणाली विकसित करना।
यह प्रणाली उन भावनाओं की पहचान करने में सक्षम है जो चेहरे के भावों से स्वचालित रूप से और सटीक रूप से विकीर्ण होती हैं।
चेहरे की अभिव्यक्तियों की सटीकता को बढ़ाने के लिए मशीन लर्निंग एल्गोरिदम के साथ प्रयोग करना।
इस परियोजना में, सीएनएन एल्गोरिथ्म का परीक्षण यह समझने के लिए किया जाता है कि यह मॉडल किस हद तक फेस ड्रॉइंग में जटिल पैटर्न को पहचानने में सक्षम है। इस प्रयास में मॉडल मापदंडों, अतिरिक्त प्रशिक्षण डेटा और डेटा वृद्धि के तरीकों का उपयोग भी शामिल है।
-
टेक स्टैक का इस्तेमाल किया
-
] ये चित्र एक लेबल से सुसज्जित हैं जिसमें सात बुनियादी अभिव्यक्ति श्रेणियां शामिल हैं।
औजार:
-
डेटा हेरफेर के लिए numpy और pandas।
- विज़ुअलाइज़ेशन के लिए Matplotlib।
कैमरे के चेहरे का पता लगाने के लिए HAAR कैस्केड।
-
परिणाम
गुस्सा
तटस्थ
-
हैरान
-
डरना
-
घिनौना
-
-
समस्या और मैं इससे कैसे निपटता हूं
-
प्रकाश अंतर की समस्या जो सटीकता के स्तर को प्रभावित करती है।
प्रकाश भिन्नता मॉडल की सटीकता को प्रभावित कर सकती है। इसे दूर करने के लिए, छवि में प्रकाश व्यवस्था को सुनिश्चित करने के लिए डेटा का सामान्यीकरण किया जाता है ताकि चेहरे की छवि में पैटर्न को बेहतर ढंग से पहचाना जा सके।
-
समान अभिव्यक्तियों की जटिलता।
कुछ अभिव्यक्तियों, जैसे "डर" और "आश्चर्यचकित", समान विशेषताएं हैं जो मॉडल द्वारा भेद करना मुश्किल है। लागू किया गया समाधान डेटा वृद्धि को रोटेशन, ज़ूम, फ़्लिपिंग, और इसके विपरीत परिवर्तन को नए डेटा के सामान्यीकरण की क्षमता में सुधार करने के लिए है।
डेटासेट जो काफी सीमित है
डेटासेट FER2013, हालांकि काफी बड़ा है, विश्व स्तर पर विभिन्न प्रकार के चेहरे की विविधताओं को कवर नहीं करता है। डेटासेट को समृद्ध करने के लिए, मैं डेटा वृद्धि तकनीक का उपयोग करता हूं और चेहरे की अभिव्यक्तियों का बेहतर प्रतिनिधित्व करने के लिए अन्य प्रासंगिक स्रोतों से डेटा जोड़ता हूं।
सीख सीखी
-
] विकास प्रक्रिया इसके महत्व को दिखाती है:
]
]
वास्तविक विश्व डेटा के मॉडल के प्रदर्शन में सुधार के लिए वृद्धि के माध्यम से प्रशिक्षण डेटा की विविधता बढ़ाना।
]
-